ウェビナー「Fivetran はじめの一歩」で登壇しました
こんにちは、shoです。
8月に入り、暑い季節になりましたね。
2020年8月4日(火)に開催したウェビナー「Fivetran はじめの一歩」に登壇しました。
本エントリでは、ウェビナーの内容とウェビナー中にあったQ&Aのついてご紹介していきたいと思います。
資料
Fivetranとは?
Fivetranはデータパイプラインサービスです。
データパイプラインサービスとは、様々なデータソースからデータを抽出し、データウェアハウスへロードを自動化することができるサービスです。
SalesforceやSAPなど様々なアプリケーションやデータベース、イベント、ファイルから抽出したデータをデータウェアハウスにロードすることができます。
また、BIツールで可視化するにあたって、変換/加工処理をデータウェアハウス内で行うことができることも主な特徴となります。
このようなことから、FivetranはELTツールとも呼ばれています。
ETLとELTの違い
ETLとは?
ETLでは、データを抽出した後、データの可視化に必要な形式にするために、変換/加工処理を行ったうえで、データウェアハウスにロードを行います。
データウェアハウスができた当初は、ストレージの使用量に対する、コストが高かったことや、処理に制限があったため、ロードする前に、データを最小限にすることが必要となっていました。
一方で、新たな可視化の要件が発生した際には、改めて要件定義からの設計が必要となり、そのためのリソースが必要なことが課題として挙げられていました。
ELTとは?
ELTでは、データを抽出した後、変換/加工処理をせずに、データウェアハウスにロードを行います。
そのため、新たな可視化の要件が発生した場合においても、データウェアハウスに取り込んだデータを変換・加工するだけで、対応が可能となることがメリットとして挙げられます。
ELTでは、すべてのデータをロードするため、データ容量や処理はデータウェアハウス側のスペックに依存します。
ビッグデータを高速処理可能なクラウド型のデータウェアハウスが登場したことで、ELTにて運用した場合も、以前よりコストをかけずに運用できるようになり、Fivetranはこの方法を使用しているツールになります。
Q&A
日本での導入実績はありますか?
国内実績を今後増やしていけるよう、Developers.IOやイベントを通じて認知度をあげていきたいと思います!
実際に、ご紹介できるようになった際には、Developers.IOなどでご紹介していきます。
実際にかかるコストのイメージがつきにくいのですが、具体的な事例が知りたいです
Fivetranは月に追加/更新されたデータに対する行数課金となります。
そのため、例えばSalesforceからデータを抽出した際に月間で100万行のデータが追加/更新されていた場合、月あたり100万行を使用することを想定した年間での費用をお見積りする形となります。
Alteryxとは一部カバー範囲がかぶっているイメージでしょうか?
Alteryxはセルフサービス分析ツールとなっており、SalesforceやAmazon S3などからデータを抽出することができるツールも提供されておりますが、Fivetranでは150種類以上のデータソースからデータを抽出することが可能となっています。
また、Fivetranはデータの抽出、ロード、変換/加工を自動化するためのサービスとなっておりますので、その点ではAlteryxとは異なるサービスとしてお考え頂けるかと思います。
最低利用期間の設定はありますか?
原則としては、1年間となります。
利用期間を1年以内でご希望の場合、別途ご相談いただく形となります。
行数課金との事ですが、課金にレコードの制限はないという事でしょうか。
レコードの制限はございません。月間使用行数を超過してご利用した月があった場合には別途お見積りをする形となります。
また、Fivetranは行数課金となるため、抽出したデータ内の項目数(カラム数)には依存することはございません。
最後に
今回、初めてウェビナーに登壇させていただきました。トレーニングやハンズオンなどの講師をする機会はあったのですが、このような機会は初めてでとても緊張しました。
まだまだ、慣れないことも多々あり課題は山積みなのですが少しでもFivetranの魅力が皆様に伝わっていれば嬉しいです。
また、本セミナーはYouTubeに公開されておりますので、ご興味のある方はぜひ一度ご覧ください。
本日、セミナーにご参加いただいた皆様ありがとうございました。